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Jj E. Jata (Cinnamomum bodinieri) 梳 时 含有 丰富 的 精油 ， 是 重要 的 园林 绿化 树种 和 经 济 树 种 ， 
但 目前 有 关 猴 樟 基 因 组 学 的 研究 报道 不 多 。 为 揭示 猴 樟 叶绿体 基因 组 特征 及 系统 发 育 关 系 ， 该 文 基 
于 高 通 量 测序 平台 进行 测序 ， 从 头 组 装 了 完整 的 猴 樟 叶绿体 基因 组 ， 并 对 其 基因 组 结构 、 基 因 构 成 
及 序列 重复 、 密 码 子 使 用 偏好 性 进行 分 析 ， 结 合 樟 亚 科 主 要 属 物种 叶绿体 基因 组 数据 构建 系统 发 育 
树 。 结 果 表 明 : (1) 猴 樟 叶绿体 基因 组 全 长 152 727 bp， 包 括 一 对 20 132 bp 的 反 向 重复 序列 (IRs) 
区 、93 605 bp 的 大 单 拷贝 (LSC) 区 和 18 858 bp 的 小 单 拷贝 (SSC) K, 总 GC 含量 为 39.13%。 (2) 
该 基因 组 共 编 码 127 个 基因 ， 包 括 83 个 蛋白 质 编码 基因 (PCGs) 、36 个 转运 RNA 基因 (tRNAs) 
和 8 个 核糖 体 RNA 基因 (rRNAs) ; 共 鉴 定 出 92 个 SSR 位 点 ， 其 中 大 部 分 是 AT 组 成 的 单 核 音 酸 
重复 序列 ， 密 码 子 适应 指数 (CAI) 为 0.166， 有 效 密 码 子 数 (ENc) 为 54.68; 猴 樟 与 近 缘 种 的 叶 绿 
体 基 因 组 主要 在 IR. 区 和 两 个 SC 区 边界 上 存在 一 定 的 差异 。 G) 24 种 樟 亚 科 植物 的 系统 发 育 树 显 
示 ， 猴 樟 与 樟树 亲缘 关系 最 近 ， 同 时 支持 了 樟 属 - 甜 樟 属 分 支 (Cinnamomum-Ocotea Clade)、 月 桂 属 
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新 木 产子 属 分 支 (Laurus-Neolitsea Clade), JEDE Jg -f2 48/8 4) xc (Machilus-Persea Clade) 的 建立 。 该 研究 
丰富 了 猴 樟 遗传 资源 信息 ， 进 一 步 确定 了 樟 亚 科 主 要 属 的 系统 发 育 地 位 。 
关键 词 : 猴 樟 ， 叶 绿 体 基因 组 ，SSR， 密 码 子 使 用 偏好 性 ， 系 统 发 育 
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Abstract: Cinnamomum bodinieri is important landscaping and economic tree species, which is rich in 
essential oils in branches and leaves. However, there are few theoretical researches on the genomics of C. 
bodinieri. In order to reveal the chloroplast genomic characteristics and phylogenetic relationship of C. 
bodinieri, the complete chloroplast genome was sequenced based on Illumina platform and assembled 
through de novo. The genome structure, gene composition, repeats, codon usage bias and phylogeny were 
analyzed subsequently. Furthermore, the phylogenetic tree was constructed with the chloroplast genome 
data of the main species of Subfam. Lauroideae. The results were as follows: (1) The complete chloroplast 
genome of C. bodinieri was 152 727 bp in length including two inverted repeats (IRs) of 20 132 bp, which 
were separated by large single copy(LSC) and short single copy(SSC) of 93 605 bp and 18 858 bp, 
respectively, and the GC content was 39.1396. (2) The genome encoded 127 functional genes, including 83 
protein-coding genes, 36 tRNA genes, and 8 rRNA genes. 92 SSR loci were detected in the chloroplast 
genome, and most of the SSRs were composed of nucleobase A and T. The codon adaptation index and 
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effective codon number were 0.166 and 54.68, respectively. There were some differences in IR region and 
the boundary of two SC regions of the chloroplast genomes between C. bodinieri and related species. (3) 
Phylogenetic tree based on 24 species of Subfam. Lauroideae showed that the C. bodinieri was closely 
related to C. camphora. The phylogeny strongly supported the establishment of the three clades, 
Cinnamomum-Ocotea, Laurus-Neolitsea, and Machilus-Persea. This study enriched the information on the 
genetic resources of C. bodinieri, and further clarified the phylogenetic status of the main genera of Subfam. 
Lauroideae. 

Keyword: Cinnamomum bodinieri, chloroplast genome, SSR, codon usage bias, phylogenetic 
叶绿体 是 植物 细胞 特有 的 细胞 器 ， 也 是 光合 作用 的 主要 场所 ， 它 们 拥有 独立 于 核 基因 组 的 完整 
的 叶绿体 基因 组 〈Shinozaki et al., 1986) 。 大 多 数 陆 生 植物 叶绿体 基因 组 大 小 在 107~ 218 kb 之 间 ， 
与 核 基 因 组 和 线粒体 组 相 比 ， 遗 传 信息 的 携带 量 相对 较 少 (Daniell et al., 2016) 。 但 叶绿体 基因 组 依 
赖 于 母系 遗传 ， 具 有 易于 提取 和 纯化 、 遗 传 信息 丰富 、 共 线性 良好 、 高 度 保守 的 序列 和 大 量 的 简单 
序列 重复 (Simple sequence repetition, SSR) 基因 座 等 优点 CDobrogojski et al., 2020) 。 近 年 来 随 着 高 
通 量 测序 技术 的 发 展 ， 研 究 者 已 相继 组 装 、 破 译 近 于 个 物种 的 叶绿体 基因 组 ， 揭 示 了 植物 物种 内 部 
和 物种 之 间 在 序列 和 结构 方面 的 变异 ， 这 些 研究 对 一 些 植物 的 系统 发 育 ， 特 别 是 阐明 进化 分 支 内 的 
物种 进化 关系 做 出 了 重大 的 贡献 (Njuguna et al., 2013; Daniell et aL, 2016) 。 

樟 科 植 物 广泛 分 布 于 世界 各 地 的 热带 与 亚热带 地 区 ,包含 50 多 个 属 3 500 多 种 (Chanderbali et al., 
2001) ,早期 分 类 系统 中 ,研究 者 利用 形态 学 特征 将 樟 科 分 为 模 亚 科 和 无 根 滕 亚 科 (Kostermans, 1957), 
而 一 直 以 来 樟 亚 科 的 系统 发 育 关 系 存在 争议 ， 在 是 否 建 立 樟 族 等 族群 以 及 棕 木 属 、 新 樟 属 等 的 系统 
发 育 地 位 等 问题 分 歧 较 多 。 随 后 基于 单个 或 多 个 叶绿体 关键 基因 区 上 段 等 分 子 序列 数据 构建 的 系统 发 
育 树 大 大 提高 对 樟 亚 科 植 物 分 类 的 理解 ， 但 依然 存在 一 个 分 辩 率 较 低 的 末端 分 文 ， 包 含 樟 族 、 月 桂 
活 等 ， 难 以 找到 形态 学 上 的 共有 衍 征 来 阐明 系统 发 育 关 系 〈 田 永 靖 ，2021) 。 近 年 来 研究 者 基于 叶 
绿 体 基因 组 将 樟 亚 科 分 为 Hypodaphnis X~ Beilschmiedia-Cryptocarya ^] X: Neocinnamomum 分 文 、 
Caryodaphnopsis ^y 3x «. Chlorocardium-Mezilaurus ^] Xx « Machilus-Persea ^j xx « Cinnamomum-Ocotea 
4] X 4l Laurus-Neolitsea ^y 3x. (Song et al., 2020) ， 其 中 Machilus-Persea 4) 3x. Cinnamomum-Ocotea 
4] X fll Laurus-Neolitsea 分 支 是 樟 亚 科 植 物 分 类 系统 中 争议 较 多 的 类 群 。 已 有 研究 表明 ， 叶 绿 体 基 因 
组 在 纠正 物种 错误 鉴定 以 及 发 现 隐 存 种 与 新 物种 方面 具有 一 定 优势 (Liu et al., 2021) o KE, 4 H 
前 樟 科 植 物 核 基因 组 、 线 粒 体 基 因 组 的 测序 、 组 装 技术 和 暂 未 普及 的 前 提 下 ， 利 用 叶绿体 基因 组 构建 
樟 科 系统 发 育 树 仍然 是 当前 的 有 效 手 段 之 一 〈Song et al., 2020; Liu et al., 2021) 。 

猴 樟 (Cinnamomum bodinieri) 是 樟 科 樟 属 常 绿 阔叶树 ， 原 产 于 中 国 ， 主 要 分 布 在 贵州 省 、 湖 南 
省 西部 和 湖北 省 西部 〈Fang et al., 2011) 。 猴 樟 外 形 美观 ， 树 冠 厚实 ， 木 材质 地 坚硬 ， 有 光泽 ， 有 香 
味 ， 枝 时 含有 丰富 的 精油 〈Xiao etal., 2020) ， 是 重要 的 园林 绿化 树种 和 经 济 树种 。 已 有 研究 主要 集 
中 在 其 生态 特征 《〈 田 小 共和 韦 小 丽 ，2011) 、 抗 逆 性 《〈 宋 芳 琳 等 ，2012) 、 栽 培 {和 育种 ( 张 怡 等 ， 
20140 ， 组 织 培 养 技术 《〈 肖 祖 飞 等 ，2020) 等 方面 ， 人 鲜 有 关于 猴 樟 叶绿体 基因 组 及 系统 发 育 方面 的 
研究 。 本 研究 基于 lumina 测序 平台 ， 对 贵州 产地 猴 樟 的 叶绿体 全 基因 组 进行 测序 、 组 装 和 注释 ， 从 
叶绿体 基因 组 结构 、SSR 位 点 、 密 码 子 使 用 偏 性 、IR 区 的 扩张 与 收缩 以 及 系统 发 育 等 方面 开展 研究 ， 
同时 结合 樟 亚 科 主要 属 的 23 个 物种 构建 系统 进化 树 ， 拟 揭示 猴 樟 叶绿体 基因 组 以 下 信息 : (1) E 
樟 叶绿体 基因 组 的 基本 特征 : (20 猴 樟 叶绿体 基因 组 SSR 位 点 及 基因 密码 子 偏好 性 情况 ; G) 猴 
樟 与 近 缘 种 的 叶绿体 基因 组 IR 区 结构 差异 ; (4) 猴 樟 叶绿体 基因 组 系统 发 育 所 属 分 文 。 

1 材料 与 方法 
1.1 试验 材料 

猴 樟 叶片 采 自 贵州 省 贵阳 市 贵州 大 学 南 校区 〈106*67' 耻 ，26?*43'N) ， 经 鉴定 为 樟 科 樟 属 猴 樟 。 

样本 经 液 氨 速冻 处 理 后 保存 于 -80 'C 冰 箱 。 
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1.2 叶绿体 全 基因 组 DNA 提取 与 测序 

选取 叶片 组 织 ， 利 用 植物 基因 组 DNA. 提取 试剂 盒 CTIANGEN Beijing China) 提取 猴 樟 DNA, 
经 过 1% 琼 脂 糖 凝 胶 电泳 和 紫外 分 光 光 度 计 检测 质量 后 利用 Humina NovaSeq 平台 完成 高 通 量 测序 。 
具体 实验 流程 按照 IIumina 公司 提供 的 标准 方法 执行 ， 将 DNA 片段 化 后 ， 对 片段 化 的 DNA 进行 及 
段 纯 化 、 末 端 修复 、3′ 端 加 A、 连接 测序 接头 ， 经 PCR 扩 增 形成 测序 文库 ， 文 库 质 检 合格 后 进行 测 
序 。 
1.3 叶绿体 全 基因 组 的 组 装 与 注释 

采用 SPAdes (v3.10.1) 软件 CBankevich et al., 2012) 组 装 叶绿体 基因 组 。 采 用 两 种 方法 对 叶 绿 
体 基因 组 进行 注释 ， 以 提高 注释 的 准确 性 。 首 先 ， 使 用 prodigal (v2.6.3) 软件 (Hyatt et al., 2010) 
注释 叶绿体 的 CDS, 使 用 hmmerCv3.1b2 ) 软 件 (Collyda et al., 2006 ) 预 测 rRNA, 使 用 aragorn Cv.1.2.38) 
软件 Laslett & Canback, 2004) 预测 tRNA。 其 次 ,根据 NCBI 上 已 经 公布 的 近 缘 物种 ， 提 取 其 基因 
序列 , 然后 使 用 blast (https://blast.ncbi.nlm.nih.gov/Blast.cgi) 比 对 组 装 的 序列 ,得 到 第 二 种 注释 结果 。 
然后 通过 对 比 去 除 错误 注释 及 元 余 的 注释 ， 确 定 多 外 显 子 边 界 ， 获 得 最 终 的 注释 。 最 后 将 注释 完成 
的 猴 樟 叶绿体 基因 组 序列 提交 至 NCBI (https://www.ncbi.nlm.nih.gov/) ， 获 得 登录 号 (MW381013 ) 。 
1.4 叶绿体 基因 组 SSR 位 点 分 析 

使 用 MISA (v1.00 软件 (Beier et al., 2017) 搜索 叶绿体 基因 组 中 的 SSR 标记 ， 设 置 单 核 背 酸 重 
复 次 数 >10, ERER RÝ > $， 三 核 苷 酸 重复 次 数 > 4， 四 核 苷 酸 、 五 核 苷 酸 和 六 核 苷 酸 SSR 
重复 次 数 > 3。 
1.5 密码 子 偏好 性 分 析 

根据 127 个 基因 的 CDS 序列 , 筛选 唯一 的 (多 个 拷贝 基因 选择 一 个 拷贝 ) 且 序列 长 度 大 于 300 bp 
的 CDS， 并 用 CodonW (v.1.4.22 软件 (Wong et al., 2010) 估计 每 个 密码 子 的 相对 同 义 密码 子 使 用 

(relative synonymous codon usage, RSCUO 、 有 效 密码 子 数 〈effective number of codons, ENc) 和 密码 

子 适应 指数 (codon adaptation index, CAD 。 
1.6 边界 分 析 

利用 近 缘 物种 新 樟 CNeocinnamomum delavayi) ~ WIE (Cinnamomum cassia) ~ $X (Sassafras 
tumu) ~ HE CLaurus nobilis) 和 大 叶 新 木 姜 子 (Neolitsea levinei) 叶绿体 基因 组 ， 通 过 Irscope 

Chttps://irscope.shinyapps.io/irapp/) 在 线 软件 (Amiryousefi et al., 2018). 进行 可 视 化 对 比 ， 分 析 4 个 

区 域 的 变化 ， 特 别 是 IR 区 的 扩张 和 收缩 以 及 IR/SC 边界 基因 种 类 和 位 置 的 变化 。 
1.7 叶绿体 基因 组 系统 发 育 分 析 

利用 猴 樟 叶绿体 基因 组 和 从 NCBI 下 载 的 23 MRE (Subfam. Lauroideae) 植物 叶绿体 基因 组 
构建 系统 发 育 树 。 利 用 MAFFT (v.7.475) 软件 (Nakamura et al., 2018) 进行 多 序列 比 对 ， 然 后 利用 
IQ-TREE (v. 2.0.3) 软件 (Nguyen et al., 2015) 构建 系统 发 育 树 ， 步 长 自 检 1 000 次 。 
2 结果 与 分 析 
2.1 叶绿体 基因 组 结构 

猴 樟 叶绿体 基因 组 全 长 为 132 727 bp (图 1) ， 呈 典型 的 四 分 体 结构 ， 由 93 605 bp ICH I 
[X (large single copy, LSC) ~ 18 858 bp 的 小 单 拷贝 区 (short single copy, SSC) 和 20 132 bp 的 一 对 
反 向 重复 区 Cinverted repeats, IRs) 组 成 。 基 因 组 总 GC 含量 为 39.13%, IR [X GC 含量 最 高 (44.37% )， 
其 次 为 LSC (37.94%) , SSC 最 低 (33.8394). 。 叶 绿 体 基因 组 共有 127 个 基因 ， 包 括 蛋 白质 编码 基 
因 83 个 、tRNA 基因 36 ^^. rRNA 基因 8 个 。 根 据 功 能 将 基因 分 成 4 类 《〈 表 1) ， 其 中 光合 作用 相 
关 基 因 45 个 ， 自 我 复制 相关 基因 70 个 ， 其 他 和 蛋白 编码 基因 5 个 ， 未 知 功能 基因 7 个 。 猴 樟 的 叶 绿 
体 基 因 组 中 ， 有 1 个 多 找 贝 基因 GRNA-Leu) 、4 个 三 拷贝 基因 (tRNA-Ser、tRNA-Arg、tRNA-Met 
和 tRNA-Val) 和 12 个 双 拷 贝 基因 ; 17 个 基因 含有 内 含 子 ， 其 中 14 个 基因 含有 1 个 内 含 子 、3 个 基 
因 (ycf3、clpP 和 rps12) 含有 2 个 内 含 子 。 
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Bl 光 系 统 I Photosystem I 
Bl 光 系 统 [[ Photosystem II 
E] 细胞 色素 复合 物 Cytochromeb/f complex 

E] ATP 合 成 酶 ATP synthase 

LE] NADP 脱 气 酶 、NADP dehydrogenase 

B] 二 磷酸 核 酮 糖 凑 化 酶 大 亚 基 RubisCO large subunit 

Bl RNARA RNA polymerase 

E] 核糖 体 蛋 白 小 亚 基 Ribosomal protein small subunit 

E] 核糖 体 蛋 白 大 亚 基 Ribosomal protein large subunit 

El cipP、matK 基 因 clpP、matK gene 

Bl 其 他 基因 Other genes 

口 假定 的 叶绿体 阅读 框 Hypothetical chloroplast reading frames 
Bl] 转运 RNA Transfer RNAs 

Bl] 核糖 体 RNA Ribosomal RNAs 
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猴 樟 叶绿体 基因 组 


Cinnamomum bodinieri 


chloroplast genome 


152 727 bp 


图 1 猴 樟 叶绿体 基因 组 图 谱 


Fig.1 Chloroplast genome map of Cinnamomum bodinieri 


de 1 猴 樟 叶绿体 基因 组 注释 基因 信息 
Table 1 Annotated gene information of Cinnamomum bodinieri chloroplast genome 


车 因 功 能 分 类 基因 种 类 基因 ID 
Gene functional Gene group Gene ID 
classification 
光合 作用 相关 基因 光 系 统 I psaB, psaA, psal, psal. psaC 
Genes related to Photosystem I 
photosynthesis 
HRAN psbA, psbK, psbl, psbM, psbD, psbC, psbZ, 


Photosystem H 


psbJ. psbL, psbF, psbE, psbB, psbT, psbN, psbH 


202211.00052v1 


chinaXiv 


自我 复制 相关 基 医 
Self-replicating 
related genes 


其 他 基 基 
Other genes 


未 知 功能 基因 


Unknown genes 


注 : 和 ”分 别 表示 该 基因 


细胞 色素 b/f 复合 体 

Cytochrome b/f complex 
ATP 合 酶 

ATP synthase 


NADH Jit 
NADH dehydrogenase 


二 磷酸 核 酮 糖 羧 化 酶 大 亚 基 
RubisCO large subunit 


RNA RAM 
RNA polymerase 


核糖 体 小 亚 基 


Ribosomal protein small subunit 


核糖 体 大 亚 基 
Ribosomal protein large Subunit 
转运 RNA 
Transfer RNAs 


核糖 体 RNA 
Ribosomal RNAs 


AGERE D 
Maturase gene 
翻译 起 始 因子 
Translational initiation factor 
乙酰 辅酶 A 羧 化 酶 亚 基 
Subunits of Acetyl-CoAcarboxylase 
E SR A AE TA 
Envelop membrane protein gene 
Protease gene 
保守 开放 性 阅读 框 
Conserved open reading frames 


HN 2, 3 次 并 以 此 类 推 ;a 和 b 各 
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petN, petA, petL, petG, petB^, petD 


atpA, atpF*, atpH, atpl, atpE, atpB 


ndhJ, ndhK, ndhC, ndhB"^, ndhF, ndhD, ndhE, 
ndhG, ndhl, ndhA*, ndhH 


rbcL 


rpoC2, rpoCl*, rpoB, rpoA 


rps12*™®, rpsl6*, rps2, rps14, rps4, rps18, rpsll, 
rps8, rps3, 1ps19, rpsT?, rpsl5, 1ps7 


rpl33, rpI20, rpl36, rpll4, rpll6, rpl2?, rpl23, 
rpl32 


tRNA-His, tRNA-Lys*, tRNA-Gln, tRNA-Ser^, 
tRNA-Gly"?*, tRNA-Arg’’, tRNA-Cys, tRNA-Asp, 
tRNA-Tyr, tRNA-Glu, tRNA-Thr?, | £RNA-Leu'^, 
tRNA-Phe, | tRNA-Met?, tRNA-Trp, tRNA-Pro, 
tRNA-Val, | tRNA-Ala*^, tRNA-Arg, tRNA-Asn™, 
tRNA-Ile?, tRNA-Val’ 


rrnl6S"?, rrnA.SS?, rrn5S?, rrn238? 


matK 
infA 

accD 
cem A 


clpP* 


ycf3*, ycfA, ycf2. ycfl?, ycf087* 


自 表示 有 1 和 2 个 内 含 子 。 


Note: ? and * indicate that the gene is copied 2, 3 times respectively and so on; a and b indicate that there are 1 and 2 introns, 


respectively. 


22 叶绿体 基因 组 SSR 位 点 分 析 


猴 樟 叶绿体 基因 组 中 


检测 到 92 个 SSR 位 点 (图 2) o SSR 主要 分 布 在 LSC 区 C70 个, 76.1%), 
其 次 是 SSC 区 (18 个 SSR) 和 IR 区 (4 个 SSR)。SSR 位 点 中 包括 68 个 单 碱 基 重复 序列 (73.9%), 
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10 个 二 碱 基 重 复 序列 〈10.9%) 、3 个 三 碱 基 重 复 序列 〈3.3%) 、8 个 四 碱 基 重 复 序列 (8.7%) 、2 
个 五 碱 基 重 复 序列 〈2.2%) 以 及 1 个 六 碱 基 重 复 序列 〈1.1%) 。 单 核 苷 酸 SSR IL RERE (A) 
ME UNE CT) 重复 。SSR 基因 序列 碱 基 组 成 中 ，A 或 工 组 成 的 SSR 占 85$.8%， 表 明 猴 樟 叶 绿 体 
的 SSR 中 碱 基 A 和 T 有 明显 的 优势 。 


国 国 大 单 拷贝 区 LSC 。。 |, 
ERE 小 单 拷贝 SSC 8 1 


ENN 反 向 重复 XIR 9 
* 10 
E: 
8 
E 
3 
总 数 Total Z6 
92 R 4 
S 
2 
lu 
& | 
S EE f p E 
REEE 


重复 序列 及 重复 长 度 
Length of repeats (bp) and repeats sequences 
2 猴 樟 叶绿体 基因 组 SSR 位 点 分 析 
Fig.2 Distribution of SSR loci of Cinnamomum bodinieri chloroplast genome 
2.3 叶绿体 基因 组 密码 子 偏好 性 分 析 
猴 樟 叶绿体 基因 组 有 效 密码 子 数 (ENc) 为 54.68， 密 码 子 适应 指数 (CAI) 为 0.166，RSCU>1 
的 密码 子 有 30 个 〈 表 2) ， 其 中 以 AU CD). 结尾 的 有 26 个 ， 以 G/C 结尾 的 有 4 个 。 乌 嗓 叭 和 胞 喀 
啶 碱 基 在 密码 子 第 三 位 出 现 频率 (GC3s) 为 33.8%， 较 叶绿体 基因 组 GC 含量 (39.13%) 低 。 
表 2 猴 樟 叶绿体 基因 组 相对 同 义 密码 子 使 用 情况 分 析 


Table 2 Relative synonymous codon usage analysis of Cinnamomum bodinieri chloroplast genome 


氨基 酸 密码 子 数量 (RSCU) 氨基 酸 密码 子 数量 (RSCU) 
Amino acid Codon Number (RSCU ) Amino acid Codon Number (RSCU) 
茶 丙 氨 酸 UUU 760 (1.11) * 丝氨酸 UCU 490 (1.45) * 
Phenylalanine UUC 605 (0.89) Serine UCC 379 (1.12) * 
TARR UUA 662 (1.49) * UCA 413 (1.23) * 
Leucine UUG 578 (1.30) * UCG 209 (0.62) 
CUU 513 (1.15) * HAR CCU 384 (1.29) * 
CUC 265 (0.60) Proline CCC 285 (0.96) 
CUA 419 (0.94) CCA 323 (1.09) * 
CUG 233 (0.52) CCG 195 (0.66) 
ARAR AUU 913 (1.33) * DS ACU 437 (1.39) * 
Isoleucine AUC 503 (0.73) Threonine ACC 295 (0.94) 
AUA 641 (0.93) ACA 349 (1.11) * 
甲 硫 氨 酸 AUG 581 (1.00) ACG 178 (0.57) 
Methionine 
DEN GUU 489 (1.32) * VIS? GCU 564 (1.64) * 
Valine GUC 214 (0.58) Alanine GCC 255 (0.74) 
GUA 507 (1.37) * GCA 394 (1.15) * 
GUG 272 (0.73) GCG 161 (0.47) 
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酷 氨 酸 UAU 653 (1.42) * EAR UGU 274 (1.25) * 
Tyrosine UAC 266 (0.58) Tryptophan UGC 164 (0.75) 
HAR CAU 479 (1.40) * AR CGU 334 (1.14) * 
Histidine CAC 205 (0.60) Arginine CGC 130 (0.44) 
谷 氮 酰 胺 CAA 648 (1.35) * CGA 376 (129) * 
Glutamine CAG 309 (0.65) CGG 191 (0.65) 
ACE AAU 769 (1.41) * 丝氨酸 AGU 357 (1.06) * 
Asparagine AAC 325 (0.59) Serine AGC 174 (0.52) 
赖 氨 酸 AAA 911 (1.38) * FAR AGA 461 (1.58) * 
Lysine AAG 412 (0.62) Arginine AGG 542 (1.17) * 
天 冬 氨 酸 GAU 666 (1.47) * 甘氨酸 GGU 375 (0.90) 
Aspartic acid GAC 238 (0.53) Glycine GGC 262 (0.57) 
RAR GAA 888 (1.38) * GGA 677 (1.42) * 
Glutamic acid GAG 398 (0.62) GGG 371 (0.60) 
终止 密码 子 UAA 196 (1.06) * 终止 密码 子 UGA 163 (0.88) 
Termination Termination 
an UAG 195 (1.06) * NK UGG 443 (1.00) 


注 : * 表 示 RSCU>1。 
Note: * indicates RSCU>1. 
2.4 IR 区 边界 的 收缩 和 扩张 分 析 

将 猴 樟 叶绿体 基因 组 与 樟 亚 科 内 近 缘 属 中 的 肉桂 、 模 木 、 新 樟 、 月 桂 和 大 叶 新 木 姜 子叶 绿 体 基 
因 组 进行 比较 ， 分 析 IR 边界 的 扩张 和 收缩 (图 3) 。 结 果 显 示 ，6 种 叶绿体 基因 组 IR 区 域 长 度 差异 
较 小 〈20 066~20 257 bp) ， 位 于 IR 区 边界 及 边界 两 侧 的 的 基因 主要 包括 yof2. ycfl. ndhF. ycfl. 
ycf2 以 及 trnH。6 个 物种 LSC-IRb OLB) 连接 处 的 基因 均 为 ycf2 基因 ，SSC-IRa OSA) 连接 处 的 基 
因 均 为 ycfl 基因 ， 在 SSC 区 的 长 度 在 4190~4 589 bp Z, ZRK, I yfl 位 于 IRa 区 长 度 明 
显 缺失 。 所 有 的 trnH 基因 均 位 于 LSC 区 ， 距 IRa-LSC (JLA) 边界 1~21 bp 不 等 。 肉 桂 和 大 叶 新 木 
姜 子 IRb-SSC (JSB) 边界 缺失 一 个 ycfl 基因 ， 其 余 4 个 物种 ycfl 在 938-1 430 bp 之 间 ， 长 度 较 短 ， 
可 能 为 假 基因 。 新 樟 JSB 边界 附近 缺失 一 个 ndhF 基因 。 


JLB JSB JSA JLA 


4 190 bp | 1426 bp 


猴 樟 Cus aU NH E 


—— BM 3 ^ 3167 bp EET 7170 » i& p ^ tRNA 
4 pote] fami 1372 bp 


i 5 


4196bp. !390bp 


BEA Sassafras tzumu Beca NR" Re 
151 797 bp Lum TS 


3126 bp | 3167 bp 


肉桂 Cinnamomum cassia BENCICITUNE UM 
152 763 bp 


IH psbA 
新 樟 Neocinnamomum delavayi m n —— — 
150 842 bp M cu = 二 二 - 
s P 4192 bp | 1367 bp 21 bp bn 
月 桂 Lauras nobilis Enalaa 
152 750 bp F 3317 bp (5 300 bp 1367 bp tà bp 
£9 bp 4196bp | 1372 L—— ÓWIPENO . tnn 
大 叶 新 木 姜 子 Neolitsea levinei om PN 
152 643 bp mt 


3 猴 樟 及 近 缘 物 种 叶绿体 基因 组 的 4 个 连接 边界 


Fig.3 Four junction boundaries of the chloroplast genomes of Cinnamomum bodinieri and related species 
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2.5 系统 发 育 分 析 
为 明确 猴 樟 在 樟 亚 科 的 系统 发 育 地 位 ， 利 用 樟 亚 科 主 要 属 中 24 个 物种 的 叶绿体 基因 组 构建 了 系 
统 发 育 树 〈 图 4) 。 根 据 节 点 支撑 将 构建 的 系统 发 育 树 分 为 八 个 分 支 。 猴 樟 所 在 分 文 樟 属 - 甜 樟 属 分 
x. (Cinnamomum-Ocotea Clade) 包括 樟 属 (Cinnamomum) TUKJ& CSassafras) ， 该 分 支 分 为 三 个 
亚 分 支 ， 樟树 (Cinnamomum camphora) UU. 100% 支 持 率 所 处 同一 亚 分 支 。 月 桂 属 -新 木 姜 子 属 
4) X (Laurus-Neolitsea Clade) 包 括 月 桂 属 (Laurus) 、 木 姜 子 属 (Litsea) ~ WAE (Actinodaphne), 
山 胡 椒 属 CLindera) 和 新 木 姜 子 属 CNeolitsea) ， 其 中 月 桂 属 、 木 姜 子 属 和 山 胡 椒 属 为 复 系 ， 黄 肉 楠 
属 和 新 木 姜 子 属 为 复 系 。 润 楠 属 - 鲍 梨 属 分 支 (Machilus-Persea Clade) 包 括 楠 属 CPhoebe) . f5352jg 
(Persea) 、 油 丹 属 (Alseodaphne) ~ Wiaj (Machilus) Ri) CNothaphoebe) 。 檬 果 樟 属 
(Caryodaphnopsis)、 新 樟 属 (Neocinnamomum)、 厚 壳 桂 属 CCryptocarya? ~ WAJA (Beilschmiedia)、 
油 果 樟 属 CSyndiclis) 为 单 系 。 此 外 ， 值 得 注意 的 是 ， 新 樟 属 与 同 为 樟 亚 族 (Subtrib. Cinnamomeae ) 
的 樟 属 和 橡木 属 关 系 较 远 。 


100 AWHA Sassafras randaiense MW337246 
100 BUK Sassafras tzumu MG581455 
10 樟 Cinnamomum camphora LC228240 
猴 樟 Cinnamomum bodinieri MW381013 
100 肉桂 Cinnamomum cassia MN812496 
100 刀 把 木 Cinnamomum pittosporoides MN047450 
100 月 桂 Laurus nobilis KY085912 


樟 属 - 甜 樟 属 分 支 
8 汤 术 木头 子 Litsea glutinosa KU382356 | 月 桂 属 -新 木 姜 子 属 分 支 
| 


Cinnamomum-Ocotea Clade 


100 山 胡 椒 Lindera glauca MG581443 
100 倒 卵 叶 黄 肉 楠 Actinodaphne obovata MN274947 
100 大 叶 新 木 姜 子 Neolitsea levinei MT621611 


Laurus-Neolitsea Clade 


100 WH Phoebe bournei MF315088 

ind HILH Phoebe chekiangensis KY346511 
楠木 Phoebe zhennan MF315089 

100 赛 楠 Nothaphoebe cavaleriei MZ433402 
WH Machilus yunnanensis KT348516 
$533 Persea americana KX437771 
细 梗 油 丹 Alseodaphne gracilis MG407593 
ERREA Caryodaphnopsis tonkinensis MN698962 


it Fi Jn - 655 28 Jm 4] c 
Machilus-Persea Clade 


RS Caryodaphnopsis 
新 


100 新 樟 Neocinnamomum delavayi LC213014 " X 
沧 江 新 樟 Neocinnamomum mekongense MF686120 樟 属 Neocinnamomum 
厚 壳 桂 Cryptocarya chinensis LC212965 | 厚 壳 桂 属 Cryptocarya 
TUR fli Beilschmiedia yunnanensis MT720945 | Iud Beilschmiedia 
安 龙 油 果 樟 Syndiclis anlungensis MT635400 | 油 果 樟 属 Syndiclis 


4 24 种 樟 亚 科 植物 叶绿体 基因 组 系统 发 育 树 


Fig.4 Phylogenetic tree of 24 species in Subfam. Lauroideae based on chloroplast genomes 
3 讨论 与 结论 


樟 科 植物 叶绿体 基因 组 全 长 在 114 603~158 598 bp 之 间 《〈 田 永 靖 ，2021) ， 差 异 较 大 ， 其 基因 组 
大 小 主要 取决 于 IR 区 的 扩张 、 收 缩 乃 至 缺失 (Huang et al., 2014) 。 猴 樟 叶 绿 体 基因 全 长 152 727 bp, 
IR 区 全 长 20 132 bp， 其 全 长 与 其 他 樟 科 植物 叶绿体 基因 组 相近 (Zhang et al., 2021) ， 且 IR 区 未 发 
生 明 显 的 扩张 与 收缩 。 猴 樟 叶 绿 体 基因 组 共 编 码 127 个 基因 ， 其 中 蛋白 质 编 码 基因 83 个 ，tRNA 基 
因 36 ^^, rRNA 基因 8 个 ,与 肉桂 (Song etal., 2019) 、 四 川 山 胡 椒 (Lindera setchuenensis) 〈 刘 测 
等 ，2021) 、 黄 丹 木 姜 子 (Litsea elongata) 〈 刘 潮 等 ，2022) 基本 一 致 ， 区 别 在 于 和 蛋白质 编码 的 基 
因数 略 有 不 同 , 总 GC 含量 在 39.13%~39.20% 之 间 。 由 此 可 见 ， 猴 樟 叶 绿 体 基因 组 在 基因 组 成 方面 与 
已 公布 的 樟 科 植物 叶绿体 基因 组 有 很 大 的 相似 性 ， 表 明 在 樟 科 植物 进化 过 程 中 叶绿体 基因 组 成 相对 
RF. 

从 猴 樟 叶绿体 基因 组 中 搜索 到 02 个 SSR 位 点 ， 其 中 以 单 核 苷 酸 重 复 为 主 ， 与 易 湖 钓 樟 CLindera 
chunii) (Tian et al., 2019) . #53 (Persea americana) (Song et al., 2016) 等 其 他 樟 科 植物 重复 序 
列 特征 相似 。 猴 樟 叶 绿 体 基因 组 SSR 位 点 主要 分 布 在 单 拷贝 区 CLSC 和 SSC) ， 其 中 LSC 区 占 比 最 
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多 ,与 猴 欢 喜 (Sloanea sinensis) 〈 王 一 磨 等 ，2021) 、 长 柄 水 青冈 (Fagus longipetiolata) (Liang et 
al., 2021 ) 等 被 子 植物 的 研究 结果 一 致 。 此 外 ,所 有 的 SSR 位 点 中 , A/T、AT/TA、AAT/TAT、AAAT/TAAA 
等 A/T 重复 类 SSR 占 总 数 的 85.8%， 与 其 他 述 科 植物 的 研究 结果 类 似 (Song et al., 2016; Tian et al., 
2019) . 在 基因 组 中 GC 含量 越 低 则 DNA 的 稳定 性 越 低 ， 因 此 ， 较 多 的 A/T 重复 类 SSR 可 能 产生 更 
多 的 突变 位 点 ， 这 些 SSR 位 点 可 进一步 开发 为 樟 属 乃至 樟 科 植物 ee 
记 。 猴 樟 叶绿体 基因 组 高 频密 码 子 有 30 个 ， 其 中 AT (U) 结尾 的 占 86%， 这 与 樟树 叶绿体 基因 
码 子 偏好 性 的 研究 结果 相似 《〈 秦 政 等 ，2018) ， 表 明 叶 绿 体 基因 组 密码 子 第 三 位 碱 基 存 在 不 对 称 性 ， 
更 加 偏好 使 用 A/T(U) 碱 基 。 此 外 ， 鸟 味 叭 和 胞 喀 啶 碱 基 在 密码 子 第 三 位 出 现 频率 〈GC3s) 明显 较 
叶绿体 基因 组 GC 含量 低 ， 与 山 胡 椒 属 (Zhao et al., 2018) 、 木 姜 子 属 (Litsea) (Zhang et al., 2021) 
物种 研究 结果 类 似 ， 表 明 猴 榜 叶 绿 体 基因 组 密码 子 更 加 偏好 A/T 碱 基 。 

本 研究 中 ，6 个 树种 IR 区 相差 较 小 ， 边 界 基因 分 布 基 本 一 致 。 位 于 SSC. LSC 与 IR 边界 的 基因 
分 别 为 ycfl 和 ycf2， 没 有 出 现 明显 的 重 排 现象 ， 与 田 永 靖 (2021) 对 34 种 榜 科 植物 叶绿体 基因 组 的 
研究 结果 一 臻 ， 表 明 樟 科 植 物 叶绿体 基因 组 的 结构 具有 较 高 的 相似 度 ， 在 进化 上 有 和 密切 的 联系 。 被 
子 植物 中 , 假 基 因 yofl C yfl) 和 ycf2( Vycf2) 等 通常 是 由 IR 区 的 扩张 与 收缩 产生 (Gu et al., 2019), 
本 研究 中 byf 在 肉桂 和 大 叶 新 木 姜 子 中 缺失 ，yyef2 在 肉桂 、 大 叶 新 木 姜 子 和 猴 樟 中 均 缺 失 。 相 比 
其 他 五 个 物种 ， 新 樟 ycfl 基因 出 现 片段 缺失 ，zdpF 则 完全 缺失 。 此 外 ，6 个 物种 ycfl 长 度 差异 较 大 ， 
主要 表现 为 位 于 SSC 区 的 长 度 变 异 明显 。 之 前 的 研究 表明 ,ycfl 和 ndhF 等 基因 缺失 和 插入 的 频率 明 
显 高 于 平均 水 平 (Daniell et al., 2016) . yf 基因 对 植物 的 生存 能 力 至 关 重 要 ， 其 在 SSC 区 部 分 具有 
较 高 的 序列 变异 性 (Dong et al., 2015) ; ndhF 基因 编码 叶绿体 NADPH 脱氧 酶 (NDH) 复 合体 的 一 个 
亚 基 ， 叶 绿 体 NDH 和 蛋白 在 维持 植物 光合 作用 和 环境 胁迫 下 的 光 保 护 时 发 挥 积极 作用 Peng et al., 
2011) ; 表明 ycfl 和 ndhF 受 环境 选择 作用 较为 明显 ， 因 此 二 者 在 系统 发 育 研究 中 被 认为 是 较 有 前 途 
的 叶绿体 基因 组 条 形 码 CAmar, 2020) 。 以 上 这 些 结果 可 为 樟 科 树种 亲缘 关系 的 鉴定 提供 新 依据 。 

本 研究 利用 NCBI 公布 的 樟 亚 科 主要 属 的 物种 叶绿体 基因 组 , 通过 系统 进化 分 析 确 定 猴 樟 在 樟 科 
植物 中 的 进化 地 位 和 亲缘 关系 。 猴 樟 与 樟树 亲缘 关系 最 近 ， 同 时 与 棕 木 属 的 棕 木 、 台 湾 棕 木 ， 以 及 
樟 属 肉桂 组 的 肉桂 和 刀 把 木 可 聚 为 一 支 ， 与 Zhang 等 (20210 的 研究 结果 一 致 。 参 考 Song 4 (2020) 
基于 叶绿体 基因 组 对 樟 科 的 分 类 ， 将 八 个 分 支 命名 为 Laurus-Neolitsea、Cinnamomum-Ocotea、 
Machilus-Persea. Neocinnamomum . Caryodaphnopsis» Cryptocarya, Beilschmiedia», Syndiclis 分 支 。 
(= 其中 ， 樟 属 - 甜 樟 属 分 支 (Cinnamomum-Ocotea Clade) 分 支 包 括 樟 属 和 模 木 属 ， 月 桂 属 、 木 姜 子 属 、 黄 
一 肉 楠 属 、 山 胡椒 属 和 新 木 姜 子 属 归 为 月 桂 属 -新 木 姜 子 属 分 文 (Laurus-Neolitsea Clade), 5 Zhang 等 
€) 20210 和 田 永 靖 〈2021) AXE T Up ERDESEDAIZH RAA. TERR Je - 8548 J8 4) Sc (Machilus-Persea 

Clade) 包 括 楠 属 、 鳄 梨 属 、 油 丹 属 、 润 楠 属 和 赛 楠 属 ， 该 结果 支持 了 Song 等 (20200 的 研究 。 此 外 ， 
Kostermans (1957) 基于 表 型 特征 将 樟 属 、 棕 木 属 、 新 樟 属 划分 为 樟 亚 族 ;， 而 本 研究 中 猴 樟 所 在 的 樟 
属 与 新 樟 属 关系 较 远 ， 对 IR 边界 的 分 析 也 文 撑 这 一 结果 ， 即 猴 樟 与 新 樟 的 ye/l 和 ndhF 基因 存在 较 
大 的 差异 ， 而 这 两 个 基因 在 系统 发 育 中 有 重要 的 作用 ， 这 些 结果 表明 新 樟 在 进化 过 程 中 受 环境 选择 
压力 作用 在 叶绿体 基因 组 上 表现 出 了 较为 明显 的 变异 。Wang 等 (2010) 基于 A-trnH. trnK 和 ITS 等 
序列 ，Li 等 (2016) 结合 RPB2. LEAFY 和 ITS 序列 以 及 田 永 靖 (20210. 基于 叶绿体 基因 组 的 研究 结 
新 樟 属 与 樟 属 、 橡 木 属 分 开 ， 在 分 类 上 应 该 具有 独立 的 地 位 ， 本 研究 所 得 结果 也 支撑 了 
。 综 上 所 述 ， 本 文 解析 了 猴 樟 叶绿体 基因 组 的 结构 、 基 因数 量 、 重 复 序 列 、 密 码 子 偏好 等 
HN "rct dii 为 进一步 研究 猴 樟 的 系统 进化 
和 育种 研究 提供 了 理论 依据 。 
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